Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable

نویسندگان

  • Cécile Low-Kam
  • Anne Laurent
  • Maguelonne Teisseire
چکیده

Résumé. Récemment, le nombre et le volume des bases de données séquentielles biologiques ont augmenté de manière considérable. Dans ce contexte, l’identification des anomalies est essentielle. La plupart des approches pour les extraire se fondent sur une base d’apprentissage ne contenant pas d’outlier. Or, dans de très nombreuses applications, les experts ne disposent pas d’une telle base. De plus, les méthodes existantes demeurent exigeantes en mémoire, ce qui les rend souvent impossibles à utiliser. Nous présentons dans cet article une nouvelle approche, basée sur un modèle de Markov d’ordre variable et sur une mesure de similarité entre objets séquentiels. Nous ajoutons aux méthodes existantes un critère d’élagage pour contrôler la taille de l’espace de recherche et sa qualité, ainsi qu’une inégalité de concentration précise pour la mesure de similarité, conduisant à une meilleure détection des outliers. Nous démontrons expérimentalement la validité de notre approche.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un modèle neuro markovien profond pour l'extraction de séquences dans des documents manuscrits

RÉSUMÉ. Dans cet article, nous proposons un système d’extraction de mots clés dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l’aide d’un modèle HMM capable de rejeter les mots n’appartenant pas à un lexique prédéfini. Afin d’être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour ...

متن کامل

Description intégrée de processus cellulaires spatiotemporels basée sur un modèle géométrique de transformation

RÉSUMÉ. L’observation de la dynamique spatiotemporelle d’objets biologiques déformables génère sous forme de séquences d’images une quantité énorme d’informations généralement sousexploitées. Nous montrons dans cet article comment une analyse de ces séquences, basée sur un modèle paramétrique de transformation, permet de caractériser de façon originale les déformations de tels objets à partir d...

متن کامل

Apprentissage de représentation pour la détection de source dans les réseaux sociaux

RÉSUMÉ. Récemment, divers travaux se sont interessés à la détection de source de diffusion dans les réseaux sociaux : il s’agit de déterminer l’utilisateur à partir duquel une information propagée a initiallement été émise. Dans cet article, nous proposons une nouvelle méthode pour la détection de source de diffusion, basée sur des techniques d’apprentissage de représentation. Plutôt que de s’a...

متن کامل

Extraction d'objets vidéo : une approche combinant les contours actifs et le flot optique

Résumé. Dans cet article, nous présentons une méthode mixte de segmentation d'objets visuels dans une séquence d'images d'une vidéo combinant à la fois une segmentation basée régions et l'estimation de mouvement par flot optique. L'approche développée est basé sur une minimisation d'une fonctionnelle d'énergie (E) qui fait intervenir les probabilités d'appartenance (densité) avec une gaussienne...

متن کامل

Interpolation par assimilation variationnelle de séquences multimodales d'images satellitaires de l'océan

RÉSUMÉ. Cet article étudie l’estimation conjointe de données manquantes et de champs de déplacements dans des séquences multimodales d’observations satellitaires géophysiques. La complexité de la tâche est liée au taux élevé de données manquantes (entre 20 % et 90 %) pour des observations journalières de haute résolution et la reconstruction de structures fines en accord avec la dynamique sous-...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009